在许多领域,例如物理科学,生命科学和金融,控制方法用于在差分方程治理的复杂动态系统中实现所需目标。在这项工作中,我们制定了控制随机部分微分方程(SPDE)作为加强学习问题的问题。我们介绍了一种基于学习的,分布式控制方法,用于使用深度确定性政策梯度方法对具有高维状态动作空间的SPDES系统的在线控制。我们测试了我们对控制随机汉堡等方程问题的方法的性能,描述了无限大域的湍流流体流动。
translated by 谷歌翻译
优先经验重播(ER)已被经验证明可以提高许多领域的样本效率,并引起了极大的关注。但是,几乎没有理论上的理解,为什么这种优先的抽样有助于其局限性。在这项工作中,我们深入研究了优先的ER。在有监督的学习环境中,我们显示了基于错误的优先采样方法,用于平方误差和均匀采样,用于立方功率损失。然后,我们提供理论上的见解,说明为什么在早期学习过程中均匀抽样时它会提高收敛速度。基于洞察力,我们进一步指出了优先ER方法的两个局限性:1)过时的优先级和2)样品空间的覆盖范围不足。为了减轻局限性,我们提出了基于模型的随机梯度Langevin动力学采样方法。我们表明,我们的方法确实提供了分布的状态,该状态接近通过Brute-Force方法估计的理想优先采样分布,该分布没有两个局限性。我们对离散和连续控制问题进行实验,以显示我们的方法的功效,并检查我们方法在自主驾驶应用中的实际含义。
translated by 谷歌翻译
本研究的目的是通过整合基于物理和人类感知的特征来开发和测试城市洪播北卡斯的新型结构化深度学习建模框架。我们提出了一种新的计算建模框架,包括基于关注的空间 - 时间图卷积网络(ASTGCN)模型以及实时收集的不同数据流,并在模型中收集,以考虑空间和时间信息和依赖项这改善了洪涝灾害。计算建模框架的新颖性是三倍;首先,由于空间和时间图卷积模块,该模型能够考虑淹没传播中的空间和时间依赖性;其次,它使得能够捕获异构时间数据流的影响,这些数据流可以发挥洪水状态,包括基于物理的特征,例如降雨强度和水高度,以及人类感知数据,例如洪水报告和人类活动的波动。第三,其注意机制使模型能够将其关注最有影响力的特征指示。我们展示了建模框架在德克萨斯州哈里斯县的背景下作为洪水事件的案例研究和飓风。结果表明,该模型为人口普查道级别的城市洪水淹没了卓越的性能,精度为0.808,并召回0.891,这与其他一些新颖的模型相比表现出更好的表现更好。此外,ASTGCN模型性能提高了异构动态功能,仅依赖于基于物理的特征,这表明了使用异源人类感测数据的洪水截图,
translated by 谷歌翻译
步态识别是与每个人相关的独特生物特征模式的表征,可以用来识别无直接接触的人。具有相对较大受试者的公共步态数据库可以为将来的研究提供一个很好的机会,以建立和验证步态身份验证模型。这项研究的目的是引入一个由93个人类受试者的全面步态数据库,他们在两个不同的课程中行走在两个端点(320米)之间,并使用两台智能手机记录其步态数据,一个附着在右大腿上,另一个附着在左侧。腰部。该数据是通过基于深度学习的方法来利用的,该方法需要足够的时间点。记录包括年龄,性别,吸烟,每日运动时间,身高和体重在内的元数据。该数据集可公开使用。
translated by 谷歌翻译